基因组的“读-改-写”技术
本文转自合成生物学期刊
基因组的“读-改-写”技术
王会1,2,戴俊彪1,2,罗周卿2
(1深圳大学生命与海洋科学学院,广东 深圳 518055;2中国科学院深圳先进技术研究院,深圳合成生物学创新研究院,合成基因组学研究中心,广东省合成基因组学重点实验室,深圳合成基因组学重点实验室,广东 深圳 518055)
识别二维码查看全文
DOI: 10.12211/2096-8280.2020-013
引用本文:王会, 戴俊彪, 罗周卿. 基因组的“读-改-写”技术[J]. 合成生物学, 2020, 1(5): 503-515
摘 要
基因组是生命系统的指令中枢,对基因组的研究是生命科学的核心内容,基因组研究相关技术的开发是深化对基因组序列和功能认识的重要推动力量。通过基因组测序获取基因组全序列,通过人工诱变、定点编辑研究基因组局部序列的功能与调控,通过对基因组的从头设计与化学再造实现对生命性状的定制,是基因组研究的三个不同层面。从一代测序到三代测序,基因组“读”技术极大地降低了成本和难度,提升了速度和精准度,引领着复杂基因组、大型基因组从草图走向完成图时代。通过人工诱变、定点编辑等技术可以改变野生型基因组的局部序列,研究基因组序列的功能与调控。从人工诱变到定点编辑,从ZFN到CRISPR,基因组“改”技术在效率、适用对象和简便性上有了显著的提高,为“基因型-表型”研究提供了有力工具,精准编辑、高通量编辑逐步走向应用。通过对基因组的从头设计与化学再造,书写人工基因组,可以获得对基因组全局的系统认识,实现对生命性状的定制。从病毒基因组合成、细菌基因组合成到酵母基因组合成,再到国际基因组写计划,基因组“写”技术在适用对象上不断拓展,人工设计、化学再造正成为复杂生物学问题研究和已有性状优化、新性状引入的一把利器。本文主要综述了基因组测序(读)、基因组编辑(改)和基因组合成(写)技术的发展历程、各自的特征、目前的研究进展及在基因组研究方面的一些应用,并对近期相关技术的可能突破点进行了总结和展望。“读-改-写”技术互为支撑,推动基因组研究在致知和致用领域两面开花。
图表摘要
图1 基因组“读-改-写”技术发展中的关键事件
表1 不同生物基因组中含有的编码序列与非编码序列的比较
表2 不同测序技术比较
表3 Cas9蛋白的不同来源及相关改造
表4 不同CRISPR/Cas系统的比较
表5 基因组合成对象复杂程度对比
表6 合成酵母SCRaMbLE系统的相关研究
总结与展望
“读-改-写”的研究技术是解析基因组奥秘的有效手段,三者相互支撑。基因组序列的读取是后续修改和再造的基础;基因组序列的编辑是注释序列功能的有效手段,可为基因组的从头设计提供理论支撑;基因组的合成再造可对野生型序列进行全局设计,是对基因组相关功能和调控机制的再验证和再利用。在未来的基因组研究中,以基因组的“读”和“改”为基因组的“写”提供更多的理论和技术支撑,以基因组的 “写”验证基因组的“读”和 “改”过程中发现的相关规律以及探索新的规律,实现“读-改-写”三位一体,将是推动基因组研究由浅到深、由点到面、由理论到应用的有效手段。
基因组学的发展对长读长的测序技术在成本和准确度等方面都提出了新的要求。对于SMRT测序技术而言,通过工程化改造DNA聚合酶以提高其持续聚合能力(processivity)和延长活性周期有望在保证准确率的前提下继续提升其读长,而优化相关试剂和仪器则有望提升其通量并降低测序成本。对于纳米孔测序技术而言,其错误率较高且这些错误更为系统化,通过增加测序的深度对降低错误率所起的作用有限。通过寻找新的纳米孔材料(如石墨烯纳米孔和固态纳米孔)、控制DNA通过纳米孔的时间以及改进电信号检测仪器的灵敏度,有望提高单碱基分辨率和降低其错误率。值得一提的是,由于肽段通过纳米孔也会产生电流的变化,利用纳米孔技术实现单分子蛋白质测序将是值得研究的方向。结合两者优势以及其他辅助组装技术,如Hi-C技术和BioNano Genomics公司的纳米通道技术(nanochannel genome mapping),将为精准的基因组完成图的获取提供利器。
复杂的生命现象的解析需要更加精准、范围更广、通量更高的基因组编辑技术。除了能够对单个位点进行编辑以外,CRISPR/Cas系统已经可以对基因组多个位点进行同时编辑。2019年,来自瑞士的科学家通过构建单质粒承载系统,成功利用Cas12a和CRISPR array实现了多达25个内源性靶点的编辑。2011年,George Church利用MAGE(multiplex automated genome engineering)和CAGE(conjugative assembly genome engineering)成功将大肠杆菌基因组中的全部314个TAG终止密码子替换为TAA终止密码子。这也是目前最具有代表性的在全基因组范围内实现大规模编辑的一项工作。目前利用基因编辑技术实现基因组范围的大规模编辑仍然具有较大的困难,如何利用CRISPR/Cas技术实现高等生物中基因组范围的多位点编辑,比如替换人类基因组中的TAG终止密码子,将是未来的发展方向。
当代合成基因组学仍然处于发展的早期阶段,如何降低合成成本以及操作大型基因组片段(组装、移植和复活等),以满足高等生物复杂基因组的合成改造,还需要大量的研究。通过对酶和核苷酸底物的优化,DNA的酶法合成有望突破化学合成法在合成长度和准确度方面的限制,但还需要大量的突破性工作;借助酵母自身的拼接系统,研究人员目前已经可以高效地进行105 bp级别的DNA组装,进一步提高多片段共转化效率以及酵母细胞内的同源重组效率有望实现Mb级别的DNA体内组装,而其他高效的外源DNA宿主(如枯草芽孢杆菌)或者高效的同源重组宿主(如耐辐射球菌)的开发则有望从另一个方向对DNA组装技术进行突破;在体内组装的大型DNA片段如何移植到目标宿主中进行功能测试是下一阶段基因组编写计划需要解决的重大技术问题,原生质体融合是目前所采用的方法之一,但是成功率较低,需要进一步优化。除了在构建技术层面的发展,合成基因组的设计理论也必须跟上。如何深度设计基因组序列以探索特定的生物学问题或者实现应用价值的最大化是需要大力发展的方向。天然基因组的优化改造(比如合成最小的酵母基因组以探索真核生物的核心组成)以及非天然基因组的设计合成(如合成具有不同宿主特性的嵌合基因组以用作优良的代谢工程底盘)将是近期有可能突破的方向。
相关阅读
Nature+Cell教你利用单细胞核测序构建最全细胞图谱 | 单细胞专题
群体遗传专题 | 同源四倍体还可以这样装?“牧草之王”紫花苜蓿基因组首次破译